#программирование ИИ23.06.2025
VERINA: новый стандарт оценки генерации проверяемого кода с помощью LLM и формальных доказательств
VERINA представляет комплексный бенчмарк для оценки LLM в генерации проверяемого кода, объединяя код, формальные спецификации и доказательства с разным уровнем сложности.